Objectifs d'apprentissage
- Décrire le cycle de vie du préentraînement et du finetuning des LLM.
- Explorer l'apprentissage par renforcement à partir du feedback humain (RLHF).
- Pratiquer l'ingénierie de prompts et les méthodes efficaces en paramètres pour le finetuning (PEFT/LoRA).